Trabajo Final del Curso Manejo y Visualización de Datos: 30 años de descubrimientos de planetas más allá del sistema solar



Autor: Lic. Joaquín Ferreyra

1 Introducción

Los exoplanetas o planetas extrasolares son planetas que orbitan alrededor de otras estrellas que se encuentran más allá de nuestro sistema solar. En los últimos 20 años se han encontrado más de 5000 planetas extrasolares, los cuales incluyen mundos pequeños y rocosos como la Tierra, gigantes gaseosos muchas veces más grandes que Júpiter, planetas “superterrestres”, que son mundos rocosos más grandes que el nuestro, y planetas “subneptunianos”, que son versiones más pequeñas del planeta Neptuno de nuestro sistema solar. También se han encontrado planetas que orbitan alrededor de dos estrellas al mismo tiempo y planetas que describen sus órbitas alrededor de los restos colapsados de estrellas muertas.

Partiendo del enorme interés y curiosidad personal en el tema como motivaciones principales, para la elaboración de este Trabajo Final se optó por la elaboración del presente documento producido en RMarkdown en el que se presenta un resumen descriptivo de las características más sobresalientes de los exoplanetas encontrados desde la década de los ’90 a la actualidad, de los sistemas planetarios de los que forman parte, sitios de descubrimiento y métodos a través de los cuales fueron hallados.

2 Materiales y métodos

2.1 Bases de datos

La base de datos principal se descargó directamente en formato .csv de la web del Archivo de Exoplanetas de la NASA. Este archivo registra los descubrimientos de exoplanetas que han sido reportados en publicaciones científicas revisadas por pares y confirmados utilizando varios métodos de detección y/o técnicas analíticas.

Para cada uno de los exoplanetas de existencia confirmada el Archivo de la NASA cuenta con información sobre el sistema planetario completo (el planeta en sí, su/s luna/s -si existen- y la estrella central del sistema). Estos datos incluyen parámetros estelares (como posiciones, magnitudes y temperaturas), información sobre los exoplanetas descubiertos (como masas y parámetros orbitales) y datos de descubrimiento/caracterización (como las instalaciones e instrumental utilizados, métodos de descubrimiento, curvas de velocidad radial publicadas, curvas de luz fotométrica, imágenes y espectros).

Por una cuestión de simplicidad en el análisis, se hizo uso de las herramientas dinámicas en la web citada para seleccionar únicamente algunas variables de interés, fundamentalmente aquellas que permiten caracterizar desde el punto de vista astronómico las características orbitales de los exoplanetas descubiertos y las relacionadas con los descubrimientos en sí (instalaciones y sitios desde los que se hicieron los hallazgos, años de descubrimiento, etc.).

A continuación se presentan las variables seleccionadas que componen la base de datos dataNASA.csv:

Variable Tipo de registro [unidades] Descripción
pl_name Caracter Nombre del planeta más comúnmente usado en la literatura.
host_name Caracter Nombre de la estrella del sistema planetario más comúnmente usado en la literatura.
sy_snum Numérico Número de estrellas en el sistema planetario.
sy_pnum Numérico Número de planetas en el sistema planetario.
sy_mnum Numérico Número de lunas en el sistema planetario.
discoverymethod Caracter Método a través del cual el planeta fue identificado por primera vez (Radial Velocity/Transits/Microlensing/Imaging/Timing Variations/Orbital Brightness/Modulation/Astrometry/Disk Kinematics).
disc_year Numérico Año de descubrimiento del planeta.
disc_locale Caracter Ubicación del sitio de observación responsable del descubrimiento (Ground/Space/Multiple Locales).
disc_facility Caracter Nombre de la instalación responsable del descubrimiento.
disc_telescope Caracter Nombre del telescopio utilizado para hacer las observaciones.
disc_instrument Caracter Nombre del instrumento utilizado para las observaciones.
pl_orbper Numérico [días] Periodo orbital del planeta: tiempo que le toma al planeta realizar una órbita completa alrededor de la estrella del sistema.
pl_orbsmax Numérico [unidades astronómicas] Semi-eje mayor de la órbita: radio más largo de una órbita elíptica o, para los exoplanetas detectados mediante microlente gravitacional o imágenes directas, la separación proyectada en el plano del cielo.
pl_rade Numérico Radio del planeta medido en unidades del radio de la Tierra.
pl_radj Numérico Radio del planeta medido en unidades del radio de Júpiter.
pl_masse Numérico Masa del planeta medida en unidades de masa de la Tierra.
sy_dist Numérico [parsecs] Distancia desde la Tierra al sistema planetario en el que se encuentra el exoplaneta.

Por otra parte, se cuenta con la base datos_geo.xlsx, la cual contiene información adicional sobre la ubicación geográfica de los sitios terrestres desde los cuales se descubrieron los exoplanetas, reunida a partir de una búsqueda en la web:

Variable Tipo de registro [unidades] Descripción
disc_facility Caracter Nombre de la instalación responsable del descubrimiento.
facility_location Caracter Lugar geográfico en el que se encuentra la instalación responsable del descubrimiento.
facility_latitude Coordenada geográfica Latitud en la que se encuentra la instalación responsable del descubrimiento.
facility_longitude Coordenada geográfica Longitud en la que se encuentra la instalación responsable del descubrimiento.

2.2 Limpieza y ordenado de los datos

En relación a la base dataNASA.csv, para poder llevar adelante el análisis de los datos se procedió a traducir los nombres de las categorías de ciertas variables con terminología específica al idioma español (por ejemplo, la variable discoverymethod), categorizar algunas variables cuantitativas (por ejemplo, las variables disc_year y pl_rade) y unificar los registros Multiple locale y Multiple locales de la variable disc_location, en tanto ambos hacen referencia a que el descubrimiento se llevó adelante con instrumentos provenientes de múltiples sitios (este detalle fue advertido durante el análisis exploratorio preliminar de la variable empleando la función table()). Todas las acciones descriptas se llevaron adelante utilizando funciones del paquete dplyr.

En relación a la base datos_geo.xlsx, como se utilizó esta información para la construcción de mapas, fue necesario expresar la información sobre latitud y longitud (que se encuentra separada en dos columnas y en el formato “grados-punto cardinal”) en un formato que pueda ser utilizado como imput por la función st_as_sf() para obtener una única columna de clase sfc_MULTIPOLYGON que posibilite la representación gráfica de las distintas ubicaciones en un mapa mediante la función geom_sf(). Además, los nombres de los países en los que se encuentran los distintos observatorios terrestres fueron traducidos al español para la presentación de la información en un mapa dinámico. Todas estas acciones fueron llevadas a cabo utilizando funciones de los paquetes dplyry tidyr.

3 Resultados

3.1 A través del tiempo…

Hasta la fecha, el número de planetas extrasolares cuya existencia ha sido confirmada asciende a 5250. En la Figura 1 se representa gráficamente el número de exoplanetas confirmados por año de descubrimiento, desde 1992, año de confirmación del primer hallazgo, a la actualidad. En general, se observa un incremento en el mismo con el correr de los años, destacándose particularmente los años 2016 y 2014 como los años en los que más exoplanetas fueron encontrados (ver más adelante). En conjunto, en estos años se encontraron 2392 planetas, lo que representa un 45.6% del total de planetas extrasolares confirmados a la fecha. Cabe destacar que, en lo que va del año en curso, se confirmó la existencia de 9 exoplanetas. Entre ellos, se encuentra el cuerpo bautizado como TOI-700e, un exoplaneta de tipo terrestre ubicado a unos 102 años luz de la Tierra.

Si se considera la distribución del número de planetas extrasolares en función del método de descubrimiento a través del cual fueron inicialmente detectados (Tabla 1) se observa que la gran mayoría de ellos fue encontrada por el método de tránsito (75.1%), seguido por el de velocidad radial (19.6%). Le siguen, en mucha menor medida, microlentes (2.9%), detección directa por imágenes (1.2%), variaciones temporales por tránsito y eclipses (0.8%) y modulación orbital de brillo, timing de púlsar, astrometría, variaciones temporales de pulso y cinemática de disco (en conjunto, 0.4%).

Tabla 1. Distribución de los exoplanetas descubiertos y de existencia confirmada según método de descubrimiento.
Método de descubrimiento Número de exoplanetas Porcentaje (%)
Tránsito 3945 75.1
Velocidad radial 1027 19.6
Microlentes 154 2.9
Detección directa 62 1.2
Variaciones en el tiempo de tránsito 24 0.5
Variaciones en el tiempo de eclipse 17 0.3
Modulación orbital del brillo 9 0.2
Tiempo de púlsar 7 0.1
Astrometría 2 0.0
Variaciones en el tiempo de púlsar 2 0.0
Cinemática de disco 1 0.0

No obstante, al considerar la distribución del número de planetas extrasolares encontrados según año y método de descubrimiento (Figura 2) se observa claramente que entre los años 1995 y 2009 la mayor parte de dichos cuerpos era detectado a través del método de velocidad radial (100% de los descubrimientos entre 1995 y 1999, 89.6% de los hallazgos en el periodo 2000-2004 y 71.2% de los exoplanetas encontrados entre 2005 y 2009), mientras que a partir de 2010 comenzó a cobrar mayor protagonismo la técnica de tránsito, responsable de más del 80.0% de los hallazgos en los periodos 2010-2014 y 2015-2019. Es preciso señalar que otro método que se volvió relevante a partir del 2010 fue el método de microlentes gravitacionales, aunque en mucha menor medida que los mencionados anteriormente (1.5% de los descubrimientos entre 2010 y 2014, 2.5% de los hallazgos en el periodo 2015-2019 y 5.9% de los exoplanetas encontrados a partir de 2020).

3.2 Características de los exoplanetas encontrados

3.2.1 Periodos y tamaños orbitales, radios y masas planetarias

A continuación, se comentarán brevemente las características de los planetas extrasolares confirmados en relación a sus periodos orbitales, radios planetarios, masas planetarias y tamaños orbitales (en la Tabla 2 se presentan algunas medidas descriptivas para las variables mencionadas).

Periodo orbital (tiempo que le toma al exoplaneta dar una vuelta completa en torno a la estrella central del sistema). En cuanto al periodo orbital (Figura 3, con escala logarítmica en el eje de abscisas para facilitar la visualización), se observa una distribución de tipo bimodal y marcadamente asimétrica hacia la derecha, con un máximo principal en torno a los 10 días terrestres y uno secundario alrededor de los 1000. Los cuerpos hallados poseen periodos que van desde los 0.09 días terrestres (un poco más de 2 horas) a unos impactantes 402000000 días (más de un millón de años terrestres). El 75% de los exoplanetas de existencia confirmada para los que se cuenta con esta información posee un periodo orbital menor o igual a los 41.4 días terrestres y sólo el 0.1% supera los 100000 (aproximadamente 273 años terrestres). En la misma figura, se representa la duración del año terrestre para ser tomado como referencia. Del Archivo consultado, hay 193 planetas para los que no se cuenta con información acerca de esta variable.

Radio planetario. La distribución de la variable radio planetario (Figura 4) también es bimodal y marcadamente asimétrica hacia la derecha, con un máximo principal en torno a los 2.5 radios terrestres y uno secundario en torno a los 13. Los cuerpos hallados poseen tamaños que van desde los 0.3 radios terrestres a los 77.3, y el 50% de los exoplanetas cuya existencia ha sido confirmada presenta un radio menor o igual a 2.74 veces el radio de la Tierra, lo que deja en claro que la gran mayoría de los cuerpos encontrados posee un tamaño mayor al de nuestro planeta. Por su parte, el gráfico de la derecha, de violín y boxplot, pone en evidencia que existen sólo 4 planetas extrasolares confirmados con tamaños superiores a 30 radios terrestres. Del Archivo consultado, hay 17 planetas para los que no se cuenta con información acerca de esta variable.

En función del radio, los exoplanetas suelen clasificarse según su semejanza de tamaño con los de algunos planetas del Sistema Solar (Figura 5). La mayor parte de ellos son de tipo neptuniano (37.8%, con radios entre 2 y 6 veces el de la Tierra), seguido por un 22.1% de planetas jovianos (radios entre 6 y 13.7 veces el radio terrestre) y un 20.5% de planetas superterrestres (con radios mayores al de la Tierra pero menores al de Neptuno). En menor medida, se han encontrado planetas que pueden clasificarse como superjovianos (9.4%, con radios mayores al de Júpiter) y sólo el 9.3% de los planetas confirmados presenta un radio similar al de la Tierra. Finalmente, sólo un 0.6% de los exoplanetas puede clasificarse como subterrestres, ya que presentan un tamaño menor al de la Tierra (más similar al de Marte o incluso al de Mercurio).

Masa planetaria. Al igual que las variables anteriormente mencionadas, la distribución de la masa de los planetas extrasolares encontrados (Figura 6, con escala logarítmica en el eje de abscisas para facilitar la visualización) también es bimodal y con una asimetría marcada hacia la derecha. Se observa un máximo principal centrado en torno a las 8 masas terrestres y uno secundario en torno a las 600 masas terrestres. Cabe destacar que 5039 exoplanetas presentan una masa superior a la de la Tierra, lo que representa un 96.4% de los cuerpos cuya existencia ha sido confirmada hasta la fecha. Existen 23 planetas para los que no se cuenta con información sobre esta variable.

Tabla 2. Periodo orbital, tamaño orbital, radio planetario y masa planetaria de los exoplanetas confirmados.
Medidas descriptivas
Variable Mediana RI Mínimo Máximo
Periodo orbital (días) 11.9 38.5 0.18 402000000.0
Radio orbital (UA) 0.1 0.2 0.01 7506.0
Radio planetario (radios terrestres) 2.7 9.2 0.30 30.5
Masa planetaria (masas terrestres) 8.2 126.1 0.02 45700.0

Semi-eje mayor de la órbita (tamaño orbital). Los exoplanetas confirmados poseen radios orbitales que van desde las 0.004 hasta las 7506 unidades astronómicas (una unidad astronómica equivale a la distancia Tierra-Sol), aunque la gran mayoría de los planetas para los que se cuenta con esta información (85.3%) se encuentra más cerca de la estrella central del sistema que lo que la Tierra se encuentra del Sol. Del Archivo consultado, existen 289 planetas confirmados para los que no se cuenta con información acerca de esta variable.

Semi-eje mayor de la órbita vs. periodo orbital. En el diagrama de dispersión de la Figura 7 (construido realizando una transformación logarítmica de ambas variables) se representa el semi-eje mayor de la órbita en función del periodo orbital de los exoplanetas de existencia confirmada. Se observa claramente que existe un alto grado de asociación lineal entre el logaritmo del tiempo que le toma al planeta completar una órbita en torno a la estrella y el de la distancia que existe entre ambos cuerpos. El comportamiento observado es una prueba de la universalidad de la Tercera Ley del Movimiento Planetario de Kepler, según la cual la relación entre el cubo del semi-eje mayor de la órbita de un planeta y el cuadrado de su periodo orbital es aproximadamente constante:

\[\frac{(Semieje)^3}{(Periodo orbital)^2} = constante\]

Masa planetaria vs. periodo orbital. En la Figura 8 se representa, para cada exoplaneta, la masa planetaria en función de su periodo orbital. Los diferentes colores en el gráfico representan los distintos métodos de detección empleados, y este detalle pone en evidencia algunas diferencias importantes en las características de los cuerpos que los distintos métodos detectan preferentemente. El gráfico muestra claramente que a través del método de tránsito tienden a encontrarse aquellos planetas con periodos orbitales pequeños, es decir, los que se encuentran relativamente cerca de la estrella del sistema. Por su parte, los exoplanetas que se detectan en forma directa se caracterizan por poseer periodos orbitales muy grandes y ser masivos. Finalmente, con respecto al método de velocidad radial, si bien ha permitido detectar exoplanetas dentro de un rango amplio de masas y periodos orbitales, la mayor concentración de puntos que se observa en la región de masas y periodos relativamente grandes sugiere que éste conduce preferentemente a la detección de planetas con estas características.

3.2.2 Número de estrellas y planetas por sistema planetario

Número de estrellas y de planetas en el sistema. En las Figuras 9 y 10 se representa gráficamente la distribución de las variables número de estrellas y número de planetas en los sistemas de los que forman parte los planetas extrasolares. El número de estrellas en la totalidad de los sistemas estudiados se encuentra entre 1 y 4, aunque la enorme mayoría de los exoplanetas descubiertos forma parte de sistemas que poseen una única estrella central (91%). En relación al número de planetas que los componen, los sistemas estudiados se encuentran compuestos por entre 1 y 8 exoplanetas. Un 90.9% de los sistemas de los que forman parte los planetas de existencia confirmada se encuentran formados por entre 1 y 3 exoplanetas.

Tabla 3. Número de estrellas y de planetas en los sistemas planetarios de los que forman parte los planetas extrasolares confirmados.
Medidas descriptivas
Variable Mediana Media Rango intercuartil Desvío estándar
Número de estrellas 1 1.10 0 0.34
Número de planetas 1 1.77 1 1.16

Cabe destacar que, hasta la fecha, no se ha encontrado ninguna luna que orbite alguno de los planetas extrasolares de existencia confirmada.

3.2.3 Distancia de los sistemas extrasolares a la Tierra

La distancia que separa a los sistemas confirmados de nuestro planeta (Figura 11) sigue una distribución asimétrica hacia la derecha, con valores que van desde los 4.2 a los 27723 años luz (Figura 11), con el 50% de los mismos ubicado a una distancia menor o igual a 1371 años luz. Del Archivo consultado, existen 17 planetas para los que no se cuenta con esta información.

3.3 Lugar de descubrimiento

Los exoplanetas confirmados hasta la fecha fueron hallados principalmente a través de telescopios espaciales (68.5%) y en menor medida desde observatorios terrestres (31.3%), en ambos casos desde locaciones únicas (único telescopio y único observatorio, respectivamente). Un mínimo porcentaje de todos los descubrimientos se realizó desde instalaciones o sitios múltiples (sólo un 0.3% del total de exoplanetas confirmados).

En la Figura 13 se representa la distribución del número de exoplanetas descubiertos por año y sitio de descubrimiento. Dicho gráfico permite observar en forma clara que, si bien los primeros hallazgos utilizando un telescopio espacial datan del año 2003, hasta el 2009 prácticamente la totalidad de los descubrimientos se realizaba desde un observatorio terrestre (más del 90% de los hallazgos anuales). A partir de ese año, los telescopios espaciales comenzaron a cobrar especial relevancia, destacándose particularmente los años 2016 y 2014, en los que más del 90% de los descubrimientos se hicieron desde el espacio.

3.3.1 Telescopios espaciales

Si se analizan únicamente los hallazgos realizados desde telescopios espaciales (Figura 14), se ve que los responsables de los saltos cuantitativos observados en 2014 y 2016 fueron el Telescopio Espacial Kepler y su continuación en forma de la Misión K2, los cuales tuvieron un desempeño preponderante durante la mayor parte de la década de 2010. En conjunto, son responsables del 90.4% del total de los descubrimientos realizados directamente desde el espacio (Tabla 4). Aunque con una contribución mucho más modesta, desde el 2019 comenzó a cobrar relevancia la actuación del Telescopio Espacial TESS, una misión lanzada en el año 2018 que hasta la fecha ha permitido encontrar un total de 286 exoplanetas, lo que representa un 8.1% de los hallazgos realizados desde el espacio.

Tabla 4. Distribución de los exoplanetas descubiertos desde el espacio según el telescopio o misión responsable del hallazgo.
Telescopio/misión Número de exoplanetas Porcentaje (%)
Telescopio Espacial Kepler 2708 75.3
Misión K2 543 15.1
Telescopio Espacial TESS 291 8.1
Misión CoRoT 35 1.0
Otros satélites/telescopios espaciales 12 0.3
Telescopio Espacial Hubble 6 0.2

3.3.2 Observatorios terrestres

En el siguiente mapa dinámico se encuentra representada la ubicación geográfica de cada uno de los observatorios e instalaciones terrestres desde los cuales se produjeron los hallazgos de los exoplanetas de existencia confirmada. Al pasar el cursor por encima de cada ubicación, puede leerse el nombre de la instalación junto con el número de exoplanetas que se descubrieron desde allí.

Es importante remarcar que para la construcción del mapa se omitieron aquellos descubrimientos que no fueron realizados desde un sitio terrestre en concreto (es decir, aquellos que se hicieron desde instalaciones ubicadas en varios países o múltiples observatorios).

De aquellos descubrimientos que fueron llevados a cabo desde un único sitio terrestre en concreto, la mayor parte se realizó desde instalaciones ubicadas en Chile (41.8%), seguido por Estados Unidos (28.6%). El resto de los países presentan frecuencias menores o iguales al 6.2% (Tabla 5), entre los que pueden mencionarse Francia, Sudáfrica y España. Como curiosidad, cabe señalar que desde las instalaciones del Complejo Astronómico El Leoncito, ubicado en la provincia de San Juan, se descubrió un único exoplaneta: el cuerpo bautizado como RR Cae b, en el año 2012.

Tabla 5. Distribución de los exoplanetas descubiertos desde observatorios terrestres en concreto según el país en el que se encuentran.
País Número de exoplanetas Porcentaje (%)
Chile 434 41.8
Estados Unidos 297 28.6
Francia 64 6.2
Sudáfrica 47 4.5
España 46 4.4
Australia 39 3.8
Japón 35 3.4
Nueva Zelanda 28 2.7
República de Korea 22 2.1
Qatar 10 1.0
Alemania 8 0.8
China 5 0.5
Puerto Rico 3 0.3
Argentina 1 0.1

4 Conclusiones

  • A modo de cierre, el análisis realizado en el presente reporte sobre las variables seleccionadas del Archivo de Exoplanetas de la NASA ha permitido poner en práctica muchas de las herramientas vistas a lo largo del curso.

  • Por las características de las bases utilizadas, el único trabajo de limpieza y ordenado que fue necesario realizar tuvo que ver fundamentalmente con la categorización de variables cuantitativas para una interpretación más accesible y la recategorización de algunas variables cualitativas por traducción al español de nombres en inglés o combinación de categorías. Sí fue preciso realizar un trabajo cuidadoso sobre la base datos_geo.xlsx para convertir los datos de ubicaciones geográficas de observatorios terrestres (latitud y longitud) a un formato que permitiera luego su representación gráfica en un mapa.

  • La diversidad de variables presentes en los datasets (cualitativas y cuantitativas discretas y continuas, incluyendo coordenadas geográficas) posibilitó la inclusión en el documento de una variedad de herramientas gráficas de visualización, entre las que se cuentan gráficos de barras, histogramas, gráficos de violín, boxplots, gráficos de bastones, diagramas de dispersión y herramientas de georreferencia, las cuales resultaron fundamentales para resumir y compartir la información seleccionada del Archivo de Exoplanetas de una forma clara y concisa.